今后如果没有特殊情况,生信菜鸟团成员将每周为大家带来一期文献速递,推荐我们过去一周看到的好文献。所有的推荐完全不独立公正第三方,只是根据个人喜好推荐,希望对你有所帮助。
文献专栏推出后得到粉丝们热烈的欢迎,但是投票率缺有点不够“热情”,希望大家阅读完毕之后在文章最后选出你认为最感兴趣的文章,就可能在下一周看到这篇文章更详细的解读和测评哈,赶紧动手转发推荐给你的朋友一起投票参与,笔芯
供稿人:Lakeseafly
一句话评价
基因组注释:我们仍然很难做到完美注释
文章信息
题目:Next-generation genome annotation: we still struggle to get it right
杂志:Genome Biology
时间:16 May 2019
链接: https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1715-2
文章介绍:
随着基因组测序革命的到来,科学家已经展开了数千个新基因组的测序和组装。但是目前使用的基因组注释方法,仍然使和我们在过去二十年中使用的技术几乎相同。使用完全自动化的注释流程程序很大的减轻了我们的工作,但是不能忽视的是,其注释中的错误与过去一样普遍。那现在问题来了,我们如何解决这个日益严重的问题?
这篇文章是一篇Genome Biology编辑推荐的一篇文章,讲述了一个我们可能每天都会接触到,但是可能没有认真思考到的问题:目前我们的注释真的已经让人满意了吗?目前测序技术已经越来越先进,三代长测序的到来带来了更加完整,质量更加好的基因组组装,但是主流的注释流程还是旧的一套使用de novo 基因注释加上短序列的RNA-seq。文章作者的核心观点就是,除了测序技术的进步外,注释流程也应该进步起来,充分利用全长转录组测序带来的优势,进一步提升目前基因注释的质量。
供稿人:Lakeseafly
一句话评价
别以为你稳了!不在参考基因组中的基因同样可能非常重要
文章信息
题目:The tomato pan-genome uncovers new genes and a rare allele regulating fruit flavor
杂志:Nature Genetic
时间:13 May 2019
链接: https://www.nature.com/articles/s41588-019-0410-2
figure
文章介绍:
摘要
该研究构建了栽培番茄及其近亲的泛基因组,其包括351Mb大小的序列和4,873个未被参考基因组捕获的蛋白质编码基因。其中观察到泛基因组中25.8%的基因表现出不同程度的存在/缺失变异PAV,突出了番茄的多样性遗传组成,具有未来改良的潜在用途。
推荐原因
泛基因组是一直以来比较热门的研究话题,近年来发的文章大多数都能上到各大有名的期刊(大多数都是一区的高分文章)。该文章提供了一个很好的例子,如何去利用已经发表的数据(深度不高的数据),进行构建泛基因组,然后挖掘相关的基因,从PAV的角度讲述了作物进化选择的故事,值得做群体遗传方面,或者对数据挖掘有兴趣的小伙伴一读。
供稿人:冰糖
一句话评价
长Read的重复序列的正确定位
文章信息
题目:Resolving repeat families with long reads
杂志:BMC Bioinformatics
时间:9 May 2019(Published)
链接: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-019-2807-4
figure
PacBio SMRT技术的测序读长分布情况,平均达到10Kb-15Kb。
文章介绍:
三代测序的Read长度普遍很长,PacBio SMRT的Read长度平均在10-15kb,这些长Read中的重复序列如转座子序列如何正确定位到基因组上并进行基因组的装配是一个棘手的问题。
三代测序的超长Read的特点很大程度上提高了基因组装配的准确度,原核生物的基因组较为简单,体量也较小,往往通过超长的Read就可以将其它的Read正确定位。但是对于真核生物而言,它的基因组较大,而且存在散步在基因组上的长重复序列,如转座子。如何将这种长重复序列定位到正确的位置对于基因组装配是一个难题。
本文因此提出了一个解决方案,首先对重复序列Read进行取样,然后执行多序列对比。这些多序列比对的每个碱基位置会存在多种碱基,通过对每一个碱基位置的所有碱基变体执行统计分析获得显著的碱基(每个位置有四种情况ATCG,但是显著碱基可能只有AC)。根据显著碱基的分布情况对Read进行分组,并对分组内的Read执行简单聚类。然后利用聚类结果进行重复序列的定位,它只允许邻近的Read是在基因组上重叠的Read。
供稿人:大吉
一句话评价
一个 miRNA-disease 预测网站
文章信息
题目:MISIM v2.0: a web server for inferring microRNA functional similarity based on microRNA-disease associations
杂志:Nucleic Acids Research
时间:09 May 2019
链接: https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkz328/5487262
figure
网站预览图
文章介绍:
MicroRNA 是一类长度 21~24nt 的非编码 RNA 分子,参与多个生命过程,在健康和疾病中都发挥着关键作用。因此,评估miRNA的功能关系,预测 miRNA 与疾病关联能够推进 miRNA 在疾病中的研究。为此,团队开发了 MISIM v2.0 在线工具,数据内容较 1.0 版本增加了 3 倍,通过改进了原始 MISIM 算法,实现通过评分预测miRNA与疾病的关系,并提供功能富集分析可视化工具。算法内容可以查看原文。
MISIM v2.0基于HMDD v3.0 数据库的miRNA-疾病数据,并整合 miRBase(版本22.1)中所包含的miRNA 与疾病关联的数据。目前,MISIM v2.0 包含 14250个 miRNA与疾病关联的数据,总共包含1044个miRNA 和 613 种疾病,以及来自 TAM2.0 的 547个miRNA 数据集。做疾病相关 miRNA 的小伙伴可以尝试一下哟。
在线网址:http://www.lirmed.com/misim/
大侠别走,留下投票,我们下周再见